EnclosedBaseJsonRecordReader.java example

Explorer

spatial-framework-for-hadoop-master
- hive
  - src
    - main
      - java
        com
        esri
        hadoop
        hive
        BinUtils.java
        GeometryUtils.java
        HiveGeometry.java
        HiveGeometryOIHelper.java
        LogUtils.java
        ST_Aggr_ConvexHull.java
        ST_Aggr_Intersection.java
        ST_Aggr_Union.java
        ST_Area.java
        ST_AsBinary.java
        ST_AsGeoJson.java
        ST_AsJson.java
        ST_AsShape.java
        ST_AsText.java
        ST_Bin.java
        ST_BinEnvelope.java
        ST_Boundary.java
        ST_Buffer.java
        ST_Centroid.java
        ST_Contains.java
        ST_ConvexHull.java
        ST_CoordDim.java
        ST_Crosses.java
        ST_Difference.java
        ST_Dimension.java
        ST_Disjoint.java
        ST_Distance.java
        ST_EndPoint.java
        ST_EnvIntersects.java
        ST_Envelope.java
        ST_Equals.java
        ST_ExteriorRing.java
        ST_GeodesicLengthWGS84.java
        ST_GeomCollection.java
        ST_GeomFromGeoJson.java
        ST_GeomFromJson.java
        ST_GeomFromShape.java
        ST_GeomFromText.java
        ST_GeomFromWKB.java
        ST_Geometry.java
        ST_GeometryAccessor.java
        ST_GeometryN.java
        ST_GeometryProcessing.java
        ST_GeometryRelational.java
        ST_GeometryType.java
        ST_InteriorRingN.java
        ST_Intersection.java
        ST_Intersects.java
        ST_Is3D.java
        ST_IsClosed.java
        ST_IsEmpty.java
        ST_IsMeasured.java
        ST_IsRing.java
        ST_IsSimple.java
        ST_Length.java
        ST_LineFromWKB.java
        ST_LineString.java
        ST_M.java
        ST_MLineFromWKB.java
        ST_MPointFromWKB.java
        ST_MPolyFromWKB.java
        ST_MaxM.java
        ST_MaxX.java
        ST_MaxY.java
        ST_MaxZ.java
        ST_MinM.java
        ST_MinX.java
        ST_MinY.java
        ST_MinZ.java
        ST_MultiLineString.java
        ST_MultiPoint.java
        ST_MultiPolygon.java
        ST_NumGeometries.java
        ST_NumInteriorRing.java
        ST_NumPoints.java
        ST_Overlaps.java
        ST_Point.java
        ST_PointFromWKB.java
        ST_PointN.java
        ST_PointZ.java
        ST_PolyFromWKB.java
        ST_Polygon.java
        ST_Relate.java
        ST_SRID.java
        ST_SetSRID.java
        ST_StartPoint.java
        ST_SymmetricDiff.java
        ST_Touches.java
        ST_Union.java
        ST_Within.java
        ST_X.java
        ST_Y.java
        ST_Z.java
        serde
        BaseJsonSerDe.java
        EsriJsonSerDe.java
        GeoJsonSerDe.java
        JsonSerde.java
        shims
        HiveShims.java
    - test
      - java
        com
        esri
        hadoop
        hive
        TestStAsShape.java
        TestStGeomFromShape.java
        TestStGeometryType.java
        TestStLineString.java
        TestStMinX.java
        TestStMinY.java
        TestStMultiPoint.java
        TestStMultiPolygon.java
        TestStPoint.java
        TestStX.java
        TestStY.java
        serde
        JsonSerDeTestingBase.java
        TestEsriJsonSerDe.java
        TestGeoJsonSerDe.java
- json
  - src
    - main
      - java
        com
        esri
        json
        EsriFeature.java
        EsriFeatureClass.java
        EsriField.java
        EsriFieldType.java
        EsriJsonFactory.java
        deserializer
        GeometryJsonDeserializer.java
        GeometryTypeJsonDeserializer.java
        SpatialReferenceJsonDeserializer.java
        hadoop
        EnclosedBaseJsonRecordReader.java
        EnclosedEsriJsonInputFormat.java
        EnclosedEsriJsonRecordReader.java
        EnclosedGeoJsonInputFormat.java
        EnclosedGeoJsonRecordReader.java
        EnclosedJsonInputFormat.java
        EnclosedJsonRecordReader.java
        UnenclosedBaseJsonRecordReader.java
        UnenclosedEsriJsonInputFormat.java
        UnenclosedEsriJsonRecordReader.java
        UnenclosedGeoJsonInputFormat.java
        UnenclosedGeoJsonRecordReader.java
        UnenclosedJsonInputFormat.java
        UnenclosedJsonRecordReader.java
        serializer
        GeometryJsonSerializer.java
        GeometryTypeJsonSerializer.java
        SpatialReferenceJsonSerializer.java
    - test
      - java
        com
        esri
        json
        hadoop
        TestEnclosedEsriJsonRecordReader.java
        TestEnclosedGeoJsonRecordReader.java
        TestUnenclosedEsriJsonRecordMrv1.java
        TestUnenclosedEsriJsonRecordReader.java
        TestUnenclosedGeoJsonRecordReader.java

package com.esri.json.hadoop;

import java.io.IOException;
import java.io.InputStream;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.hadoop.mapreduce.RecordReader;
import org.apache.hadoop.mapreduce.TaskAttemptContext;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;

import org.codehaus.jackson.JsonFactory;
import org.codehaus.jackson.JsonNode;
import org.codehaus.jackson.JsonParser;
import org.codehaus.jackson.JsonToken;
import org.codehaus.jackson.map.ObjectMapper;

/**
 * Enumerates records from an Enclosed JSON file - use either Esri JSON or GeoJSON subclass
 */
public abstract class EnclosedBaseJsonRecordReader extends RecordReader<LongWritable, Text> implements
    org.apache.hadoop.mapred.RecordReader<LongWritable, Text> {
	static final Log LOG = LogFactory.getLog(EnclosedBaseJsonRecordReader.class.getName());

	protected LongWritable mkey = null;
	protected Text mval = null;
	protected InputStream inputStream;
    protected long splitLen = 0;  // for getProgress
	protected JsonParser parser;

	protected EnclosedBaseJsonRecordReader() throws IOException {
		mkey = createKey();
		mval = createValue();
	}

	protected EnclosedBaseJsonRecordReader(org.apache.hadoop.mapred.InputSplit split,
										   Configuration conf) throws IOException {
		org.apache.hadoop.mapred.FileSplit fileSplit = (org.apache.hadoop.mapred.FileSplit)split;
        splitLen = fileSplit.getLength();  // using MRv1
        commonInit(fileSplit.getPath(), conf);
	}

	@Override
	public void close() throws IOException {
		if (inputStream != null)
			inputStream.close();
	}

	@Override
	public LongWritable createKey() {
		return new LongWritable();
	}

	@Override
	public Text createValue() {
		return new Text();
	}

	@Override
	public LongWritable getCurrentKey() throws IOException, InterruptedException {
		return mkey;
	}

	@Override
	public Text getCurrentValue() throws IOException, InterruptedException {
		return mval;
	}

	@Override
	public long getPos() throws IOException {
		if (parser == null){
			return 0;
		} else {
			return parser.getCurrentLocation().getCharOffset();
		}
	}

	@Override
	public float getProgress() throws IOException {
		if (splitLen == 0 || parser == null) return 0;
		
		return (float)parser.getCurrentLocation().getByteOffset() / splitLen;
	}

	@Override
	public void initialize(InputSplit split, TaskAttemptContext taskContext)
				throws IOException, InterruptedException {
		FileSplit fileSplit = (FileSplit)split;
        splitLen = fileSplit.getLength();  // using MRv2
        commonInit(fileSplit.getPath(), taskContext.getConfiguration());
	}

    // Both Esri JSON and GeoJSON conveniently have "features"
	@Override
	public boolean next(LongWritable key, Text value) throws IOException {
		JsonToken token;
		
		// first call to nextKeyValue() so we need to create the parser and move to the
		// feature array
		if (parser == null) {
			parser = new JsonFactory().createJsonParser(inputStream);
			
			parser.setCodec(new ObjectMapper());
			
			token = parser.nextToken();
			
			while (token != null && !(token == JsonToken.START_ARRAY &&
					parser.getCurrentName() != null && parser.getCurrentName().equals("features"))) {
				token = parser.nextToken();
			}
			
			if (token == null) return false; // never found the features array
		}

		key.set(parser.getCurrentLocation().getCharOffset());
		
		token = parser.nextToken();
		
		// this token should be a start object with no name
		if (token == null || !(token == JsonToken.START_OBJECT && parser.getCurrentName() == null))
			return false;

		JsonNode node = parser.readValueAsTree();

		value.set(node.toString());

		return true;
	}

	@Override
	public boolean nextKeyValue() throws IOException, InterruptedException {
		return next(mkey, mval);
	}


    private void commonInit(Path filePath, Configuration conf) throws IOException {
		FileSystem fs = filePath.getFileSystem(conf);
		inputStream = fs.open(filePath);
	}
}